(Much) Faster Construction of SMT Phrase Tables from Large-scale Parallel Corpora (Construction (très) rapide de tables de traduction à partir de grands bi-textes) [in French]
نویسندگان
چکیده
Résumé. Dans cet article de démonstration, nous introduisons un logiciel permettant de construire des tables de traduction de manière beaucoup plus rapide que ne le font les techniques à l’état de l’art. Cette accélération notable est obtenue par le biais d’un double échantillonnage : l’un permet la sélection d’un nombre limité de bi-phrases contenant les segments à traduire, l’autre réalise un alignement à la volée de ces bi-phrases pour extraire des exemples de traduction.
منابع مشابه
DaFOE : une plateforme pour construire des ontologies à partir de textes et de thésaurus
Depuis son émergence, au début des années 1990, dans les recherches en modélisation de connaissances, la notion d’ontologie s’est rapidement diffusée dans un grand nombre de domaines de recherche en informatique. Compte tenu du caractère très prometteur de cette notion, de nombreux travaux ont visé à permettre son utilisation dans des domaines aussi divers que le traitement automatique de la la...
متن کاملConstruction of a Free Large Part-of-Speech Annotated Corpus in French (Construction d'un large corpus écrit libre annoté morpho-syntaxiquement en français) [in French]
RÉSUMÉ Cet article étudie la possibilité de créer un nouveau corpus écrit en français annoté morphosyntaxiquement à partir d’un corpus annoté existant. Nos objectifs sont de se libérer de la licence d’exploitation contraignante du corpus d’origine et d’obtenir une modernisation perpétuelle des textes. Nous montrons qu’un corpus pré-annoté automatiquement peut permettre d’entraîner un étiqueteur...
متن کاملConstruction d'ontologies à partir de textes : la phase de conceptualisation
Résumé : Dans cet article nous nous interrogeons sur la manière d’outiller la phase de conceptualisation lors de la construction d’une ontologie à partir de textes. La mise en perspective des résultats obtenus à partir de techniques issues de la terminologie et de la fouille de textes est réalisée selon trois plans (discours, linguistique et conceptuel). Cette étude permet de mieux appréhender ...
متن کاملConstruction d'ontologies à partir de textes: une approche basée sur l'Ingénierie Dirigée par les Modèles
La plupart des outils de construction d’ontologies existant permettent de construire des ontologies en précisant la représentation des concepts et leurs sémantiques. Ces derniers ne précisent ni la manière de trouver les concepts ni la façon de décrire leur signification. Ces outils supposent que l’ontologie de domaine que l’on souhaite représenter existe déjà. Or, la conception d'une telle ont...
متن کاملApproche générique pour l'extraction de relations à partir de textes
Résumé : Cet article s’intéresse à l’extraction de relations dans le contexte du web sémantique, en vue de procéder à de la construction d’ontologies aussi bien qu’à de l’annotation automatique de documents. Notre approche permet l’extraction de relations entre entités à partir de textes. Elle ne fait pas d’hypothèse sur les entités, de manière à la rendre aussi générique que possible, et à aut...
متن کامل